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Spracheingabe-Interfano 



Dxe Erfindung betrifft systeme, bei danen daa Sprechen eines 
Anwenders aufgenommen und als signal weitergeleitet wird 
Insbesondere betrifft die Erfindung Systeme, bei denen ub,er 
eine Spraeheingabe Funktionen ausgelost Oder gesteuert wer- 
den 
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Systeme mit Spraeheingabe und Sprachsteuerung sind bekannt 
So sxnd.beispielsweise bei Computern Eingaben - Diktiererx von 
Texten oder Steuerbef ehle - per Sprache moglich. In der Medi- 
zmtechnik existieren Gerate, die zur Entlastung bei schwie- 
rxgen Eingriffen durch Spraehkommandos dee Arztes gesteuert 
werden Jconnen. Auch im Sicherheitsbereich werden Vorriohtun- 
gen eingesetzt, die beispielsweise eine verschlossene Tur se- 
lektxv nur auf Spracheingaben autorisierter Personen offrxen. 

Alle derartigen System erfordern fur das Erkennen der sprach- 
ixchen Information bzw. Kommandos eine hohe akustische Quali- 
tat der Spraeheingabe. Besonders storend wirkt sieh bei- 
spielsweise ein 2U groSer Abstand zwischen Milcrofon und Mund 
des Spreehers aus (zu geringe Eingabelautstarke) . m gleieher 
Weise wirkt ein Spreehen in eine Richtung, die nieht im 
Hauptaufnahmebereieh des Mikrofons liegt. Aueh eine relativ 
nahe Distanz zum Mikrofon kann sich negativ auswirken, da in 
dxesem Pall zum einen leieht eine tfcersteuerurxg des Aufnahme- 
pegels auftreten kann, zum anderen durch den Atmen des Spre- 
ehers zusatzlich starke akustisehe Storgerausche (Windge^au- ' 



2 

sche) entstehen konneru Grundsatzlich wirkt sich. auch ein ho- 
her Gerauschpegel aus der Umgebung sehr storend auf die Er- 
kennungsgenauigkeit des Spracheingabesystems aus . 

5 Urn diese bekannten Probleme zu losen, werden beispielsweise 
fur Computersysteme mit Texteingabe Mikrof onbiigel eingesetzt, 
die (zumeist in Verbindung mit einem Kopfhorer oder Ohrhorer) 
vom Anwender am Kopf getragen werden. Bei ent spare chender Aua- 
richtung des Bugels befindet sich das Auf nahmemikrofon auch 
^10 bei Kopfbewegungen stets in gleichem Abstand nahe am Mund des 
M m Sprechers . Nachteilig ist dabei die eingeschranlcte Bewegungs- 
freiheit aufgrund der ublichen Kabel verbindung zum Computer- 
Auch konnen Storgerausche durch Bewegungen des Kabels auftre- 
ten. Zudem empfinden viele Personen das Tragen von Kopf- oder 
15 Ohrhorem, insbesondere bei langerer Anwendung, als unancje- 
nehm. 

Alternativ werden daher auch Mikrofone mit stationarer Posi- 
tion, z.B. Tischmikrofon mit Stativ oder integriert in das 
Gehause (PC, Laptop) oder befestigt am Gerat (Tftrrahmen t>ei 
Sicherungsfunktion) verwendet . Nachteilig ist dabei die auf 
einen bestimmten Raumbereich vor dem Mikrofon beschrankte 
Auf nahme zone. Dies erfordert vom Anwender die Einhaltung ei- 
ner definierte Position, Korperhaltung, Sprechrichtung usw., 
d.h. es besteht praktisch keine Bewegungsf reiheit. wahrend der 
Spracheingabe . 

Ausgehend von diesem Stand der Technik liegt dear vorliegenden 
Erfindung die Aufgabe zugrunde, ein verbessertes System zur 
Spracheingabe zu entwickeln, das die genannten Nachteile 
weitgehend uberwindet und zusatzliche Vorteile auf weist . 
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Diese Aufgabe wird bei einer Vorrichtung mit den Merkmalen 
des Oberbegriffs des Anspruchs 1 gelost durch die kennzeich- 
nenden Merkmale des Anspruchs 1. Weitere Einzelheiten der Er- 
findung und Vorzuge verschiedener Ausf uhrungsf ormen sind Ge- 
genstand der Merkmale der Unteranspriiche . 

Die erf indungsgemafie Vorrichtung wird im folgenden anhand ei- 
ner bevorzugten Ausf uhrungsf orm beschrieben, wobei Bezug ge- 
nommen wird auf die Abbildungen . und den darin aufgefuhrten 
Bezugszif f ern. 

Dabei zeigen: 

Fig. 1 das erf indungsgemaSe Spracheingabesystem aus 
Zentraleinheit und separaten Sprachinterf ace 

Fig. 2 eine schematische Darstellung einer Ausf uhrungsf orm 
des Sprachinterf aces 

Fig. 3 Richtcharakteristik des vom Anwender mitgefiihrten 
Sprachinterf aces 

Die vorliegende ETrfindung zielt darauf ab, Komfort und Quali- 
tat bei Spracheingabesystemen deutlich zu verbessem. Dabei 
soil ein mit Mikrofonen ausgestattetes transpor tables Sprach- 
interf ace vom Anwender standig getragen werden, wodurch ihm 
letztlich ein universeller Sprachzugang zu vear sc hi edenen Sys- 
temen ermoglicht wird. Durch Verwendung von Mikrofonarrays 
kann auch bei verschiedenen akustischen Umgebungen eine hohe 
Eingabequalitat gegeniiber Storgerauschen errei cht werden. Da- 
mit ist es auch als Spracheingabesystem in Fahrzeugen geeig- 
net, da Storungen durch Fahrgerausche oder EchLoeffekte bei 
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Lautspr-echerausgaben vom Mikrofonarray vermindert werden Pur 
exn standig zu tragenden Sprachinterf aces ist es wichtig, 

dass es klein und leicht i e,h -4 - 

a xexcnt ist und - 3e nach auSerer Gestaltung 

- beispielsweise als Schmuck oder Identif ikatiorxssymbol ak- 
zeptiert wird . 



Fig. 1 zeigt als Obersioht die zusa^menwirkenden Komponenten 
des Spracheingabesystems. Das Sprachinterfaoe (2) lst als mo 
bile Einheit ausgefuhrt und wird vom Anwender. z.B an der 
Kleidung, getragen. Es ubertragt die akustisch aufgenommenen 
Sprachsxgnale drahtlos, z.B. par Infrarot- Oder Funkverbin- 
dung an die Zentraleinheit (l) , ln der die signale 

aufbereitet werden und diverse Steuerfunktionen ausgelost 
werden . 

Zur Gewahrleistung einer hohen Qualitat der Sprachaufnahme 
werst das Sprachinterfaoe (2) zwei Oder mehrere Mikrofone 
(3a, 3b, 3o) auf . Eine solohe Anordnung ist in Pig. 2 vergro- 
Eert dargestellt. ^ 

Die verwendeten Mikrofone (3a, 3b, 3o) konnen indiviauelle 
Richtcharakteristiken (Niere, Hyperniere, Aoht) aufweisen 
Danut wird bereits duroh eine vordef inierte Mikrofon-Ri ch t_ 
oharakteristik Schall vorrangig aus einer bestimmten Zone 
verstarkt auf genommen . 

Die hier erf indungsgemaS vorgesohlagene Varwendnng eines 
kleinen „ikrofonsyste m s nit zwei Oder m ehr „i k rofone„ erlaubt 
dre Brldung von Mikrof onarrays . Duroh das Zusammenwirken der 
Mrkrof one in eine m solohen Mikrofonarray kann - in Verbindung 
«t erner fur solohe Arrays ublichen elektronisehen AufbereJ 
tung - dxe Qualitat der Spraoheingabe wesentlich verbes S ert 
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werden: So kann - uber die oben erwihnte, unverSnderliche 
Mikrofon-Richtcharakteristik hinaus - eine spezielle raumli- 
che Richtwirkung des Mikrofonarrays eingestellt werden d h 
akustische Signale werden vorrangig aus einem gewunschten 
. Raumbereich (Mundpartie des Anwenders) aufgenorwnen. Durch 
dxese zusatzliehe Array-Richtcharakteristik werden Nebenge- 
rausche aus anderen Bereichen der U m gebung welter unterdruckb 
bzw. konnen elektronisch wextgehend herausgef il tert werden. 

Die Array-Riohtcharakteristik ergibt sioh aus der Anzahl und 
geometrischer Anordnung der Mikrofone. I m einfaonsten Fa.ll 
werden zwei Mikrofone verwendet (Minimalkonfiguration) Vor- 
zugsweise ist das Interface jedoch mit drei (wie in Fig 2 
dargestellt) Oder mehr Mikrofonen ausgestattet, die ei ne bes- 
sere Richtwirkung und Storschallunterdruckung em,6gliche n . Es 
gxbt zwei grundsatzliche Mikrof on-Array-Anordnungen: .broad- 
side- und -end- fire-. Bei -broad-side- liegt die Richtwirkung 
senkrecht auf der gedaohten Verbindungslinie der Mikrofone 
bei -end-fire- liegt die Richtwirkung in Riohtung der gedaoh- 
ten verbindungslinie der Mikrofone. Das Ausgangesigna! eines 

broad-side- Arrays ergibt sioh in einfachster Form aus der 
suction der einzelnen Signals, beim -end-firs- Array aus 

der Differenz, wobei auoh Lauf zeitkorrekturen eingesetzt wer- 
den . 

Die Richtwirkung des Mikrofonarrays kann durch weitere Mafi- 
nataen verandert und da m it eine adaptive Richtcharakteristik 
erreioht werdsn. Dabei werden die einzelnen Mikrofon Signale 
nrcht einfach addiert Oder subtrahiert. sondem durch spe- 
zxelle Signalverarbeitungsalgorithmen so ausgewertet, da S s a- 
ta.ti.che signale aus einer Hauptriohtung verstar-kt e^fangen 
werden und Kebengerausche aus anderen Riohtungen abgescnwal 
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aufgenommen werden. Die Lage der Hauptrichtung ist dabei ver- 
anderbar\ d.h. sie kann adaptiv an ein sich anderndes akusti- 
sches Szenario angepafit werden- Dabei kann beispielsweise die 
Art und Weise, wie das Signal der Hauptrichtung bewertet und 
maximiert wird und gleichzeitig Storgerausche aus Nebenrich- 
tungen minimiert werden, in einem Fehlerkriterium festgelegt 
sein. Algorithmen zur Erzeugung einer adapt iven Richtwir\kung 
sind unter dem Begriff 'Beamf orming* bekannt. Vearbreitete Al- 
gorithmen sind z.B. der Jim-Griffith Beamformer oder der- 
* Frost ' Beamformer . 

Durch Veranderung entsprechender Parameter kann die Haupt- 
richtung beim "Beamforming* so variiert werden, ciass sie mit 
der Richtung aus der gesprochen wird ubereinstimmt , was einer 
aktiven Sprecherortung entspricht. Eine einfache Moglichkeit 
die Sprechrichtung zu bestimmen ist z.B. die Lauf zeitschat- 
zung zwischen zwei Empf angssignalen zweier Mikrofone. Wizrd 
die Kreuzkorrelation zwischen den beiden Werten errechnefc, so 
ergibt sich der maximale Kreuzkorrelat ions -Wert bei der Lauf- 
zeitverschiebung beider Signale. Wird nun die diese Lauf zeit 
zur Verzogerung des einen Signals eingesetzt, so sind die 
beiden Signale wieder gleichphasig. Damit ist die Hauptrich- 
tung in die aktuelle Sprechrichtung eingestellt . Wird die 
Lauf zeit schatzung und Korrektur wiederholt durchgef lihrt , so 
wird einer Relativbewegung des Sprechers adaptiv gefolgt . Da- 
bei ist es vorteilhaft fur die Sprecherortung niar einen zuvor 
festgelegten Raumsektor zuzulassen. Dazu ist es erforderlich, 
die Mikrofonanordnung grob in einer gewissen Richtung zum 
Mund des Sprechers anzubringen, z.B. am Klei dungs stuck des 
Sprechers . 
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Der Mund des Anwenders kann sich dann innerhalb des festge- 
legten Raumsektors gegenuber dar Position das Sprachinter- 
faoes <2> frei bewegen. die Sprecherortung wird ihm folgen. 
Wird sine Signalguelle aufierhalb das festgelegten Raumselttors 
detektiert, dann „i rd diaaa als Storung idantifi 2iert ( be i- 
spiels„ e ise eine Lautsprecherausgabe) . Dar Bea m f orming-Algo- 
nthmus kann sich nun spaziall auf dan Schall aus dieser 
Richtung in, sinna aina Minimierung das St6rsignals einstel- 
lcn. Da.es last auch aine wirksame Eohokompensation zu. 

Pig. 3 zeigt baispielhaft ain kleines Mikrofonsysteo, aus z„ai 
einzelnen Mikrofonan m it ainar eingepragten Riohtoharakteris- 
tik dia rechts a* Mund das Sprachers vorbai gerichtat i st 
Dia Mikrofone sind hiar an dar oberan Kanta sines klei„ en " Ge . 
Musas angabracht. Dar Array-Typ ist 'broad-side-, d.h dia 
Riohtwirkung das Arrays ist sankraoht zur Kanta das Gaha US as 
nach oban gariohtat. Dia adaptive Richtwirkung ubar Baamfor- 
ming-Algorithman sorgt dafur, dass dia wirksame Richtcharak- 
teristik auf die QueUe, dan Mund das Anwenders ausgeriontet 
xst . 



Mikrofona mit hoher Qualitit aind ais Miniaturausf uhrung (bis 
harab zu Milli me tergr SS a, verfugbar. Ebenso sind drahtlose 0- 
bertragungseinrichtungen, z.B. Infrarot- Oder Punksender m it 
heutiger Teohnik (z.B. als SMD odar IC) extrem klain her- 
stallbar. Zur Stromversorgung genugt aina kleine Battarie 
bz„. Akkumulator (z.B. Knopfzelle) , da nur ein geringar Enar- 
giavarbrauch antsteht. Damit ist die Integration aUer Konpo- 
nenten des Spraohinterf aoes (2) zu einer kleinen und auoh 
aufgrund des sehr geringen Gawiohts bequen, tragbaran Einh eit 
moglzoh. Beispialsweise kann ein solohes miniaturisiertes 
Spraohinterfaoe (2) als Ansteokvorrichtung bzw. clip an der 
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Kleidung befestigt werden (vergleichbar mit einer Brosche) o- 
der an einem Armband oder einer Halskette mitgeftihrt werden. 

In einer ersten Ausf uhrungsf orm werden die jeweiligen Signale 
der einzelnen Mikrofone des Arrays parallel zur Zentralein- 
heit ubermittelt . Dort werden dann diese Signale elektronisch 
weiter verarbeitet, urn Richtungscharakteristik und Storge- 
rauschunterdruckung einzustellen. Diese Funktionen konnen al- 
ternate - zumindest teilweise - auch bereits im Sprachinter- 
face selbst erfolgen. In dem Sprachinterf ace (2) sind dann 
entsprechende elektronische Schaltkreise integriert, die fur 
eine erste Signalaufbereitung sorgen. So kann beispielsweise 
auch der jeweilige Mikrof on-AUf nahmepegel durch automat ische 
Verstarkungsregelungen (Automatic-Gain-Control ) angepaSt wer- 
den oder durch entsprechende Filter bestlmmte Frequenzanteile 
abgeschwacht oder verstarkt werden. 



Wie in Figur 2 dargestellt kann das Eingabeinterf ace (2) auch 
Komponenten fur eine Umwandlung analoger in digitale Signale 
aufweisen. Die Ubertragung digitaler Signale zur Zentralein- 
heit (1) bietet mit den heute verfugbaren Sende/Empfangs - 
techniken einen sehr hohen Inf ormationsf luss bei minimal er 
Storanf alligkeit . 

Das Sprachinterf ace (2) kann mit einer Aktivierungstaste oder 
Sensorflache ausgestattet werden, deren Betatigung/Beruhrung 
eine Spracherkennung aktiviert, beispielsweise durch Ubertra- 
gung eines entsprechenden Signals an die Zentraleinheit (1) . 
Alternativ kann eine solche Aktivierung auch durch Sprachein- 
gabe eines Schlusselwortes erfolgen. 
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In einer erweiterten Ausfuhrungsf orm weist das Sprachinter- 
face (2) zusatzlich eine Empf angseinrichtung auf (nicht dar- 
gestellt) , die drahtlos ubermittelte Steuersignale von der 
Zentraleinheit (i) empfangen kann. Damit kann die Charakte- 
rxstik der Sprachaufnahme (Kombination der Mikrofone zum Ar- 
ray, Verstarkung, Frequenzf liter usw. ) im Sprachinterface (2) 
durch die Zentraleinheit (1) verandert werden. Weiterhin kann 
die Zentraleinheit (1) uber die Empf angseinrichtung dem Be- 
nutzer auch ein akustisches oder optisches Signal ubermit- 
teln, beispielsweise als • Feedback* fur erfolgreich ausgelos- 
te Aktionen aber auch Fehlf unktionen (Kommando nicht erkannt 
Oder - z.B. wegen Storung der Schnittstellen - nicht ausfuhr- 
bare Funktion) oder zur Anforderung weiterer fiingaben (Kom- 
mando unvollstandig) . Als Signalgeber konnen Z .B. verschia- 
denfarbige LED's oder piezokeramische Kleinlautsprecher in 
das Spracheingabeinterface (2) integriert werden. Auch i st es 
denkbar, eine Eingabeeinheit , beispielsweise Taetatur, 2U r 
Exngabe von Inf ormationen in Textform vorzusehen. 

Die Zentraleinheit (1) empfangt die drahtlos ttbermittel ten 
Srgnale des Sprachinterf aces (2) und wertet sie fur eine 
Spracherkennung aus. Auch die verschiedenen erforderlichen 
Kalkulationen zur Sprecherortung und adaptivera Anpassung der 
Richtungscharakteristik des Mikrof onarrays konnen ganz oder 
teilweise in der Zentraleinheit (1) erfolgen. Die fur eine 
zuverlassige und schnelle Signalverarbeitung U nd Spracherken- 
nung erforderliche Prozessorleistung kann bei spie lsweise uber 
exn ubliches Computer- bzw. Mikroprozessorsystem zur Verfu- 
gung gestellt werden, das vorzugsweise Teil der Zentralein- 
heat (1) ist. Damit konnen anwenderspezif ische Konfiguratio- 
nen (Arraycharakteristik, Spracheigenheiten, spezielle 
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Schalt/Steuerkommandos usw.) jederzeit neu einprograiraniert 
werden . 

Da die Zentraleinheit (1) getrennt vom Sprachinterface (2) - 
z.B. integriert in Gerate (TV, Telef onanl age, PC-System usw.) 
- stationar ausgebildet ist, entstehen auch bei leistungsfa- 
higer elektronischer und EDV-technischer Ausstattung keine 
besonderen Probleme oder Einschrankungen bzgl . Stromversor- 
gung, Volumen, Gewicht oder auch Kuhlung warmeproduzierertder 
Komponenten (Prozessor) . 

Die Zentraleinheit (1) ist so konf iguriert , dass erkannte 
Kommandos iiber integrierte Schnittstellen (4a, 4b, 4c) ent- 
sprechende Schalt- und Steuerfunktionen ausldsen, auf die 
verschiedene externe Gerate reagieren. 

Hierzu konnen beispielsweise Telef onsysteme, Audio- und Vi- 
deogerate gehoren, aber auch eine Vielzahl elektrisch/elek- 
tronisch steuerbarer Hausgerate (Licht, Heizung, Klimaanlage, 
Jalousien, Tiiroffner u.v.a.m) . Bei Einsatz in einem Faharzieug 
konnen entsprechend Funktioneh des Pahrzeugs (Navigat ions sys- 
tem, Musikanlage, Klima, Scheinwerf er, Scheibenwischer usw.) 
gesteuert werden. 

Die Ubertragung der Steuersignale der Schnittstellen (4a, 4b, 
4c) zu den verschiedenen externen Geraten kann ihrerseits 
wieder drahtlos (IR, Funk) oder auch (z.B. bei Einsatz im 
Fahrzeug) mittels Kabelverbindung erfolgen. 

Die erfindungsgemaSe Spracheingabevorrichtung bietet dem An- 
wender vollige Bewegungsf reiheit (auch iiber gr6Sere Distanz 
z.B. verschiedene Raume/Etagen eines Hauses) . Hinzu tommt ein 
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optimaler Tragekomf ort , da das Sprachinterf ace (2) nicht am 
Kopf befestigt werden muS. Durch das kleine Eigengewicht und 
die geringe Grofie (insbesondere als Miniaturausf ^hrung) ent- 
steht durch das Sprachinterf ace keinerlei Behinderung, so 
dass es - vergleichbar zu einer Armbanduhr - fur ein dauer- 
haftes Tragen geeignet ist. 

Verschiedene Gerate bzw. Funktionen an unterschiedlicheia Or- 
ten konnen mit ein und demselben Sprachinterface gesteuert 
werden (Multimediaeinrichtungen, Hausgerate, Fahrzeugfunktio- 
nen, Buro-PC, Sicherheitsanwendungen, usw.), da auch .ehrere 
Zentraleinheiten an unterschiedlichen Standorten (z. B . p rl . 
vatraume, Fahrzeug, Arbeitsbereich) so eingestellt werdeza 
konnen, dass sie auf das gleiche Sprachinterface bzw. den 
15 gleichen Anwender reagieren. 



Besonders vorteilhaft ist die hohe Flexibility des vorge- 
stellten Spracheingabesystems . So ermoglicht das Mikroforaar- 
ray exne aktive - je nach Ausfuhrung auch automatische - Jus- 
tierung auf veranderte Gegebenheiten, wie z.B. and ere R aum - 
akustik-oder Befestigung des Sprachinterf aces an'anderer 
Stelle der Kleidung (andere Sprechrichtung) oder auch eixa 
neuer Anwender (eigene Sprechweise) . Durch Progranunieru ng der 
Zentraleinheit kann das Spracheingabesystem flexibel an die 
jeweiligen Steuer und Regelungsauf gaben angepaSt werdexa . • 

Grundsatzlich bietet das erf indungsgemaSe System den Vorteil 
dass das sehr kleine und leichte Sprachinterface vom Anwender 
standxg getragen werden kann. Ein Benutzer kann es ohne Be- 
hinderung auch bei sich fuhren, wenn er seinen Aufenthal tsort 
andert, z.B. in sein Auto einsteigt. Durch das Mikrofonarray 
und damit verbundenen Richtungswirkung der Scballaufnahme er- 
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gibt sich auch bei ungiinstigen Umstanden (Umgebungsgerausche) 
eine hohe akustische Sprachaufnahmequalitat . Die aufwandigen 
Prozesse der Sprachaufbereitung konnen uber entsprechend 
leistungsfahige Komponenten in der Zentraleinheit mit sehr 
hoher Erkennungssicherheit erfolgen. Dabei kann die Spracher- 
kennung individuell auf einen oder mehrere Anwender justiert 
werden, z.B. fur eine Funktionsbeschrankung nur auf vorbe- 
stimmte, autorisierte Person (en). Die Ansteuerung verschiede- 
ner Gerate iiber entsprechende Schnittstellen ist frei konfi- 
gurierbar und kann nach individuellen Wunschen far verschie- 
denste Anwendungszwecke modifiziert und erweitert werden. 
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DaimlerChrysler AG Die/Fi 



Patentansp riiche 



Spracheingabesystem aus stationarer Zentraleinheit (1) 
und transportablem Sprachinterf ace (2), wobei 
die Zentraleinheit (1) Mittel zum Empfang drahtlos viber- 
mittelter Sprachsignale und Mittel fur eine Auswertung 
dieser Sprachsignale zur Erkennung gesprochener Worte 
aufweist, sowie Schnittstellen (4a, 4b, 4c), die in Ab- 
hangigkeit von erkannten Worten Schalt- bzw. Regelsignale 
erzeugen und an externe Gerate ubertragen und wobei 
das Sprachinterf ace (2) zwei oder mehr Mikrofone (3a, 3b, 
3c) aufweist, die als Mikrof onarray kombiniert sind, so- 
wie Mittel zur drahtlosen Ubertragung der vom Mikrof onar- 
ray generierten Signale an die Zentraleinheit (1) . 

Spracheingabesystem nach Anspruch 1, 
dadurch gekennzeichnet, 
dass das Sprachinterf ace (2) Mittel zur elektronischen 
Aufbereitung der von den Mikrofonen (3a, 3b, 3c) des Mik- 
rof onarrays erzeugten Signale aufweist. 

Spracheingabsystem nach Anspruch 2, 

dadurch gekennzeichnet, 

dass die elektronische Aufbereitung eine Veranderung der 

jeweiligen Signalpegel (Verstarkung, Dampfung, AGC) und/ 
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Oder Frequenzanteile (Hohen-, Tief en- , Band- Filter) und/ 
Oder der jeweiligen Signalphasen bewirkt. 

Spracheingabesystem nach einem der Anspruche 2 oder 3 , 

dadurch gekennzeichnet 

dass die Mittel zur elektronischen Aufbereitung auch .Mit 

tel zur Umwandlung analoger in digitale Signale beinhal- 

ten. 



Spracheingabesystem nach einem der Anspruche 1 bis 4 , 
dadurch gekennzeichnet, 
dass das Sprachinterface (2) Mittel zum Empfang drahtlos 
(z.B. IR, Funk) von der Zentraleinheit (1) ttbermittel ter 
Signale aufweist. 

Spracheingabesystem nach Anspruch 2, 3 oder 4, 
dadurch gekennzeichnet, 
dass das Sprachinterface (2) Mittel zum Empfang drahtlos 
(z.B. IR, Funk) von der Zentraleinheit (1) ubermittelter 
Steuersignale aufweist, mit denen die Zentraleinheit (1) 
die Mittel zur elektronischen' Aufbereitung des Sprachin- 
terfaces (2) beeinflussen kann. 

Spracheingabesystem nach einem der Anspruche 1 bis 6, 
dadurch gekennzeichnet, 
dass die Mittel der Zentraleinheit (1) zur Auswertung der 
Sprachsignale als Prozessorsystem (EDV) auscjefuhrt sind. 

Spracheingabesystem nach Anspruch 7, 

dadurch gekennzeichnet, 

dass das Prozessorsystem Anwender-bezogene Daten (z.B. 

individuelle Sprachkommandos , Sprachparameter) speichert 
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und zur Auswertung der Sprachsignale und/oder zur Erzeu- 
• gung individuell zugeordneter Steuersignale einbezieht. 

9 . Spracheingabesystem nach einem der Anspruche l bis 8, 
dadurch gekennzeichnet , 

dass das Mikrofon-Array (3a, 3b, 3c) eine Richtcharakte- 
ristik in der Weise aufweist, dass Schall vorrangig aus 
einer Richtung aufgenommen wird. 

10. Spracheingabesystem nach Anspruch 9, 
dadurch gekennzeichnet , 

dass die Richtcharakteristik durch Aufbereitung der von 
den Mikrofonen (3a, 3b, 3c) des Mikrof onarrays erzeugten 
Signale uber Beamf orming-Algorithmen (z.B. Griffith-, 
Frost -Beamformer) verandert werden kann. 

11. Spracheingabesystem nach Anspruch 10, 
dadurch gekennzeichnet , 

dass die Richtcharakteristik in der Weise verandert wird, 
dass sie einer raumlichen Verlagerung der Schallquelle 
folgt (Sprechernachfuhrung) . 

12. Spracheingabesystem nach einem der Anspruche 1 bis 11 
dadurch gekennzeichnet , 

dass die einzelnen Mikrofone (3a, 3b, 3c) des Arrays eine 
Richtcharakteristik (z.B. Niere, Acht) aufweisen. 
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Zusammenf assun q 
Spracheingabe- In terfat!«» 



Beschrieben wird ein Spracheingabesystem, bestehend aus einer 
stationaren Zentraleinheit (1) und einem transportable*, vom 
Anwender z.B. an der Kleidung mitgefuhrten Spnrachinterf ace 
(2) . Das Sprachinterface (2) dient zur akustischen Aufnahme 
gesprochener Kommandos, die nach elektronischer- Aufbereitung 
drahtlos an die Zentraleinheit (1) ubertragen werden. Dabei 
enthalt das Sprachinterface zwei oder mehr Mikrofone (3a, 3b, 
3c) , die als Mikrof onarray zusammenwirken, wodurch einerseits 
eine Richtcharakteristik bei der Schall aufnahme und anderer- 
seits eine weitgehende Unterdriickung von Storgerauschen er- 
moglicht wird. Die Zentraleinheit (1) enthalt die Komponenten 
der Spracherkennung, z.B. Prozessorsystem, und Schnittstellen 
(4a, 4b, 4c) , iiber die externe Cerate drahtlos oder uber Ka- 
bel gesteuert werden. 



(Fig. 2) 
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